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摘要 : 近年 来 , 字 词 分 析 取 向 的 方法 逐渐 受到 重视 , 特别 是 语言 探索 与 字 词 计数 
(Linguistic Inquiry and Word Count, LIWC) 工 具 , 它 的 问世 让 许多 心理 学 家 对 语言 
分 析 研 究 重 新 燃 起 热情 。 最 新 版 本 LIWC-22 词典 的 修订 新 增 了 许多 心理 变量 , 在 
增加 了 LIWC 工具 的 应 用 潜力 的 同时 也 使 其 更 加 完善 ,为 进一步 推动 LIWC 工具 中 
文化 的 进程 ， 我 们 对 多 个 版 本 的 中 文 LIWC 词典 进行 汇总 ， 修 订 形 成 了 
SCLIWC2024， 并 对 其 效 度 进行 了 检验 。 研 究 一 中 ， 我 们 对 照 LIWC-22 词典 和 
CLIWC2015 词典 ， 以 SCLIWC 词典 为 基础 ， 修 订 形 成 了 SCLIWC2024 词典 。 研 究 
二 中 ， 我 们 进行 了 两 项 实验 来 检测 SCLIWC2024 在 不 同类 型 网 络 文本 心理 表达 的 
有 效 性 ， 并 回答 了 如 何 更 有 效 地 使 用 SCLIWC2024 来 检测 社交 网 络 平台 短文 本 的 
心理 表达 的 重要 问 
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Abstract. In recent years, the Linguistic Inquiry and Word Count (LIWC) tool has 
garnered increasing attention, offering the promise of objective, automated, and 
transparent psychological text analysis. This resurgence has reignited enthusiasm 
among psychologists for language analysis research. The recent revision of the 
LIWC-22 dictionary has introduced numerous variables aimed at assessing various 
socio-psychological structures, thus expanding the application potential of the LIWC 
tool. To further promote the cultural adaptation of the LIWC tool, we have revised 
and validated the Simplified Chinese Linguistic Inquiry and Word Count Dictionary 
2024 (SCLIWC2024) to better align with the features of LIWC-22. In Study One, 
building upon the SCLIWC dictionary, we revised SCLIWC2024 by comparing it 
with the LIWC-22 and CLIWC2015 dictionaries. In Study Two, we conducted two 
experiments to validate the efficacy of SCLIWC2024 in detecting different 
psychological semantics in online texts, addressing crucial questions regarding how to 
more effectively utilize SCLIWC2024 for detecting the psychological semantics of 
short texts on social networking platforms. 
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语言 是 人 们 将 内 心思 想 和 情感 转化 为 他 人 可 理解 的 形式 中 最 常见 、 最 可 靠 的 
方式 (Tausczik & Pennebaker, 2010)。 从 历史 上 看 ， 语 言 心理 学 的 研究 虽然 从 表达 
性 写作 研究 演变 而 来 (例如 ，Gottschalk & Gleser, 1969)， 但 已 经 扩展 到 了 社会 科 
学 中 的 各 种 主题 ,与 此 同时 , 随 着 第 一 个 心理 学 通用 计算 机 文本 分 析 程 序 General 
Inquirer(Stone et al., 1966) 的 兴起 衰落 ， 字 词 分 析 取 问 方 法 逐渐 受到 重视 ， 人 们 已 
经 认识 到 通过 计算 不 同 含义 和 词性 的 词语 的 表达 频率 可 以 发 现 文本 的 心理 意义 
(Pennebaker et al., 2014; Kacewicz et al., 2014). 

近年 来 ， 数 字 革 命 导 致 大 规模 语言 数据 的 可 用 性 增加 (Boyd & Pennebaker, 
2017)， 语 言 心 理学 研究 也 已 经 扩展 到 更 现代 的 交流 环境 中 ， 例 如 在 线 社 交 媒 体 
(Caton et al., 2015; Stanton et al., 2017)。 一 些 真正 对 用 户 友好 的 文本 分 析 软 件 一 一 
面世 、 层 出 不 穷 ， 特 别 是 由 Pennebaker 的 研究 团队 发 展 出 来 的 语言 特性 计算 机 
分 析 工 具 一 一 LIWC( 最 新 版 本 为 LIWC-22，Boyd et al., 2022)， 近 年 来 尤其 受到 
瞩目 。 事 实 上 ,研究 者 目前 对 言语 行为 和 心理 之 间 关 系 的 大 部 分 理解 都 直接 或 间 
接地 建立 在 LIWC 单词 计数 方法 上 , 它 使 客观 、 自 动 化 和 透明 的 心理 文本 分 析 的 
前 景 成 为 了 现实 (Boyd & Schwartz, 2021). 

LIWC 研究 工具 的 核心 在 于 扫描 文本 ， 并 从 预定 义 的 类 别 中 统计 单词 的 频率 。 
LIWC 词典 定义 了 各 个 来 源 于 心理 学 理论 的 类 别名 称 及 各 类 别 中 所 包含 的 字 词 
列表 , 因此 , 每 个 类 别 的 相对 频率 通常 反映 了 一 个 人 对 每 个 领域 的 相对 关注 程度 。 
最 新 修订 的 LIWC-22 词典 (Boyd et al., 2022) 由 12000 多 个 单词 、 词 干 、 短 语 和 精 
选 的 表情 符号 组 成 ,包括 情感 、 认 知 、 文 化 、 生 活 方式 等 117 个 在 心理 学 或 语言 
学 上 有 意义 的 类 别 以 及 4 个 未 公开 的 复合 式 指标 ， 由 在 评估 各 种 社会 心理 结构 。 

这 套 研究 工具 的 重要 优势 在 于 , 它 分 为 程序 主体 和 词典 两 个 部 分 允许 用 户 
扩展 词典 或 添加 新 的 类 别 , 在 搭载 各 国语 言词 典 后 , 可 用 以 分 析 不 同 语言 的 文本 
(例如 ，Meier et al., 2018; Date et al., 2024)。 对 于 中 文 词典 的 开发 ， 黄 金兰 等 人 
(2012，2020) 已 针对 LIWC2007 和 LIWC2015 分 别 进行 了 相应 版 本 词典 的 中 文化 
翻译 修订 工作 ， 形 成 了 CLIWC2007 词典 和 CLIWC2015 词典 。Gao 等 人 (2013) 
也 根据 LIWC 词典 和 CLIWC2007 词典 建立 了 专门 的 简体 中 文 LIWC 词典 
(SCLIWC), 并 将 微 博 高 频 词 添加 到 了 词典 中 。CLIWC 词典 的 建立 为 LIWC 中 文 
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化 黄 定 了 良好 的 基础 , 使 计算 机 文本 分 析 方 法 应 用 于 繁体 中 文 文本 分 析 的 相关 研 
究 成 为 可 能 ，SCLIWC 词典 则 在 LIWC 研究 工具 和 简体 中 文 之 间架 起 了 桥梁 。 
在 过 去 的 20 ZEE, LWC 以 及 其 他 语言 版 本 的 词典 已 经 越 来 越 普 遍地 被 
应 用 于 不 同 的 研究 领域 中 ， 特 别 是 更 新 后 的 LIWC-22 版 词典 又 引入 了 许多 新 的 
类 别 。LIWC 词类 所 描述 的 语言 特征 反映 了 人 们 的 注意 焦点 (Brockmeyer et al., 
2015)、 认 知 过 程 (Konopasky et al., 2020)、 情 感情 绪 (Sun et al., 2020)、 社 会 行为 
(Samson et al., 2023)、 状态 与 动机 (Cherrstrom, 2023), 生活 方式 (Varma et al., 2021)、 


心理 健康 (O”Dea et al., 2017)、 诚 实 与 欺骗 (Markowitz & Griffin, 2020)、 思 维 方 


式 (Markowitz, 2023), 个体 差异 (Ulrichové& & Havigerova, 2023) 等 心理 与 行为 过 程 。 
在 计算 机 领域 , LIWC 也 被 用 作 语 言 模 型 , 用 于 预测 人 格 特质 (Hall & Caton, 2017)、 
沟通 行为 (Biggiogera et al., 2021)、 心 理 健康 (Lyu et al., 2023)、 身 体 健 康 (Ziemer & 
Korkmaz, 2017) 以 及 政治 竞选 结果 (Jordan et al., 2018) 等 。LIWC 在 各 个 领域 的 研 
究 和 数 以 千 计 的 引用 次 数 都 足以 证 明 其 在 语言 分 析 研 究 中 的 重要 地 位 。 

在 LIWC 词典 中 文化 的 工作 上 ， 虽 然 已 有 黄金 兰 等 人 (2012，2020) 建 立 的 
CLIWC2007 和 CLIWC2015 词典 、Gao 等 人 (2013) 建 立 的 SCLIWC 词典 , 但 随 着 
LIWC-22 英文 版 词典 的 修订 ，Boyd 等 人 (2022) 不 仅 建 立 了 多 个 全 新 词类 ， 增 加 
了 LIWC 的 应 用 潜力 ， 同 时 修订 了 原 有 类 别 涵盖 的 单词 列表 ， 使 其 更 加 完善 。 
此 ,我 们 的 工作 重点 是 借助 词 向 量 大 模型 ， 综 合 心理 学 和 计算 机 科学 方法 ， 根 据 
LIWC-22 英文 词典 和 CLIWC2015 中 文 词典 对 SCLIWC2024 词典 进行 更 新 和 效 
度 检 验 ， 以 符合 LIWC-22 的 特性 。 


研究 1 SCLIWC2024 的 建立 


本 研究 的 目的 是 基于 LIWC-22 词典 和 CLIWC2015 词典 修订 SCLIWC2024 

词典 ， 下 面 我 们 将 详细 说 明 SCLIWC2024 词典 的 修订 过 程 。 
(一 ) 添加 新 增 词 

第 一 阶段 的 修订 则 在 依据 CLIWC2015 修订 原则 对 SCLIWC2024 词典 进行 新 
增 词类 和 新 增 词 添加 。 

CLIWC2015 词典 共 79 个 词类 ， 其 中 61 个 词类 与 旧版 SCLIWC 词典 相同 ， 
18 个 词类 为 新 增 词类 。 参 考 CLIWC2015 词典 修订 手册 ,并 两 两 比 对 CLIWC2007、 
CLIWC2015、 旧 版 SCLIWC 词典 的 词类 和 词 ， 我 们 对 SCLIWC2024 词典 做 出 以 


下 修订 。 

第 一 ， 尊 循 CLIWC2015 添加 新 词类 的 原则 , 我 们 在 SCLIWC2024 中 直接 增 
加 了 驱 力 词 (Drives)、 联 系 词 (affiliatiomy)、 权 力 词 (powenD、 酬 赏 词 reward)、 风 险 
词 Gisg、 女 性 词 (female)、 男 性 词 male)、 非 正式 词 (informaD、 网 络 用 词 (netspealo、、 
比较 词 (compare)、 疑 问 词 (interrog) 和 差异 词 (differ) 共 12 个 新 词类 ， 并 直接 使 用 
CLIWC2015( 简 体 ) 中 这 12 类 的 词 。 需 要 注意 的 是 ， 非 正式 词 (informal) 在 第 二 阶 
段 与 LIWC-22 融合 过 程 中 更 名 为 会 话 词 (Conversation)。 

第 二 ， 对 于 时 态 标定 词类 ， 我 们 将 旧版 SCLIWC 词典 中 PastM、PresentM、 
FutureM 词类 的 词 分 别 与 CLIWC2015 中 的 focuspast、focuspresent、focusfuture 
合并 去 重 ， 形 成 三 个 新 的 词类 : 过 去 (focuspast)、 现 在 (focuspresent)、 未 来 
(focusfuture)。 

第 三 ，CLIWC2015 将 CLIWC2007 的 多 功能 词类 (MultiFun) 重 新 分 类 到 了 语 
助词 类 Particle(Interjunction)， 并 进一步 区 分 为 情态 语 助词 (Modal pa) 与 一 般 语 助 
词 (General_pa) 两 个 子 词类 。 针 对 这 一 点 ,我 们 直接 使 用 CLIWC2015 中 的 Particle、 
Modal pa. General pa 三 个 词类 ， 替 换 掉 了 SCLIWC2024 中 的 Interjunction 与 


MultiFun. 

第 四 ， 对 于 各 个 词类 下 的 新 增 词 ， 通 过 比 对 简体 和 繁体 CLIWC2015, RII 
发 现 简体 版 和 少 部 分 繁体 版 翻译 后 的 新 增 词 符合 大 陆 普 通话 习惯 且 履 盖 较 全 ， 
此 我 们 将 CLIWC2015 剩余 61 个 词类 中 的 新 增 词 合 并 去 重 后 直接 添加 进 了 
SCLIWC2024 对 应 的 词类 。 

经 过 第 一 阶段 修订 后 的 SCLIWC2024 词 典 包含 84 个 词类 , 共计 14229 个 词 。 
需要 注意 的 是 ， 针 对 CLIWC2015 删除 的 词类 以 及 拆 分 合并 的 词类 ， 我 们 在 
SCLIWC2024 中 仍 了 予以 保留 ， 只 增加 CLIWC2015 的 新 增 词 类 。 

(=) 融合 LIWC-22 词典 

第 二 阶段 的 修订 旨 在 依据 LIWC-22 词典 修订 原则 对 SCLIWC2024 词典 进行 
新 词类 ( 词 ) 增 加 和 旧 词 类 更 新 。 

相 比 于 以 往 的 任何 版 本 ，LIWC-22 的 每 个 方面 都 经 历 了 重大 更 新 。 在 词典 
整体 结构 上 ，LIWC-22 将 类 别 划分 为 “Basic” 和 “Expanded” 超 类 别 。 在 概念 
上 ，Basic 类 包含 了 早期 LIWC 版 本 的 大 多 数 维度 ，Expanded 类 则 包括 了 更 新 后 


的 传统 LIWC 类 别 以 及 其 它 新 增 类 别 ( 详 见 Boyd et al., 2022). #42 LIWC-22 的 
修订 过 程 ， 我 们 遵循 三 个 原则 对 SCLIWC2024 进行 修订 。 一 是 将 LIWC-22 的 新 
增 词类 、 更 新 的 旧 词 类 (共计 32 个 ) 直 接 翻 译 ， 筛 选 后 加 入 或 修改 SCLIWC2024， 
并 根据 LIWC-22 词典 修改 SCLIWC2024 词典 结构 ， 二 是 逐 类 对 比 LIWC-22 和 
LIWC2015, 将 旧 词 类 的 新 增 词 加 入 SCLIWC2024; 三 是 保留 LIWC-22 删除 的 词 
28; 比较 词 (compare)、 疑 问 词 (interrog)、 相 对 词 (Relative)。 

在 翻译 过 程 中 , 考虑 到 中 英文 在 语言 特性 上 的 差异 , 我 们 删除 了 形容 词 (adj)、 
冠 词 (article) 和 LIWC-22 新 增 的 限定 词 (deb 三 个 词类 。 此 外 ，LIWC-22 的 四 个 总 
结 变量 都 来 源 于 Pennebaker 团队 之 前 发 表 的 研究 结果 (Boyd et al., 2022)， 但 并 未 
透明 公开 , 因此 也 不 予以 考虑 。 最 终 , 我 们 总 共 整 理 翻译 了 99 个 LIWC-22 词类 。 

在 完成 对 LIWC-22 词典 的 翻译 后 ， 我 们 计算 了 每 个 词 的 相似 度 以 辅助 进行 
词类 适合 度 评估 。 具 体 来 说 ， 对 每 一 词类 ,我们 选取 了 其 英文 词类 名 称 或 特征 作 
为 标准 词 ， 例 如 成 就 词 (achieve) 的 标准 词 为 achieve， 消 极 情 绪 (emo_neg) 的 标准 
词 为 negative。 然 后 我 们 对 词类 中 每 个 单词 的 释义 词 向 量 与 标准 词 词 向 量 分 别 计 
算 余弦 相似 度 并 进行 高 低 排 序 。 

在 词 条 相似 度 排序 的 基础 上 , 我 们 训练 了 两 名 研究 生 对 每 个 词类 中 所 有 的 翻 
译 词 条 进行 了 词类 适合 度 的 人 工 评 判 。 具 体 来 说 ， 我 们 将 词 条 平均 分 为 两 组 ， 
组 各 由 一 名 研究 生 进行 评判 ， 完 成 后 再 互 换 词 条 进行 评判 。 对 每 个 词 条 项 目 , 均 
会 得 到 两 个 判断 反应 ， 知 判断 反应 一 致 (全 部 适合 /全 部 不 适合 )， 则 了 予以 保留 / 删 
除 。 然 后 ， 再 由 两 位 工作 人 员 对 判断 反应 不 一 致 的 词 条 项 目 进行 判断 ， 将 反应 一 
致 的 予以 保留 /删除 。 

以 往 LIWC 研究 显示 , 过 去 常 被 忽视 的 功能 词类 及 其 组 合 词类 , 具有 相当 不 
错 的 心理 特性 表征 功能 (Tausczik & Pennebaker, 2010)。 因 此 ， 我 们 还 重新 修订 了 
SCLIWC2024 的 功能 词 (function)。 考虑 到 不 同 语言 的 使 用 差异 , 我 们 没有 直接 使 
用 LIWC-22 翻译 得 到 的 功能 词 ， 而 是 参考 相关 简体 中 文 词典 书籍 ( 崔 玉 珍 , 2013; 
方 清明 , 2017; 刘 月 华 等 , 2019; 齐 沪 扬 , 2011; 中 国 社会 科学 院 语言 研究 所 词典 
编辑 室 , 2016)， 对 照 汉 语 语法 类 别 使 用 介绍 与 词典 说 明 ， 综 合 统 整 出 分 属 各 功能 
词类 的 词语 。 


接 下 来 ， 参 考 CLIWC2007 的 建立 (黄金 兰 等 ，2012)， 我 们 完成 了 


SCLIWC2024 的 单一 词 确定 。 首 先 , 我 们 对 现 有 中 文 词 条 项 目 进行 分 词 处 理 ， 以 
此 作为 单一 词 判断 依据 。 然 后 ， 根 据 词 条 所 属 类 别 以 及 《现代 汉语 词典 (第 7 
版 ) 》( 中 国 社会 科学 院 语言 研究 所 词典 编辑 室 ，2016) 对 被 断 成 两 个 词 及 以 上 的 
翻译 词 进行 保留 、 删 除 或 修改 。 

对 于 词典 中 的 词 干 ，LIWC 利用 词 干 加 星 号 的 方式 来 侦 测 同 词 干 的 词 群 。 
CLIWC 词典 (黄金 兰 等 , 2012, 2020) 则 以 词 首 字 为 词 干 (或 称 词素 ) 来 标示 相对 应 
的 概念 , 例如 , 用 悲 * 来 侦 测 悲伤 、 悲痛、 悲哀 、 悲 协 、 悲 苦 等 悲伤 词 。 参 考 CLIWC 
词 干 建立 的 方法 ， 我 们 对 SCLIWC2024 补充 了 新 的 词 干 。 我 们 首先 根据 
SCLIWC2024 现 有 词 干 侦 测 了 LIWC-22 新 增 词 并 予以 删除 ， 然 后 对 剩余 每 个 词 
类 的 新 增 词 建立 词 干 。 我 们 参考 了 《现代 汉语 词典 (第 7 版 ) 》( 中 国 社会 科学 
院 语 言 研 究 所 词典 编辑 室 , 2016), 若 “ 某 词 *” 下 所 有 的 词 均 可 归 为 同一 类 ( 几 类 )， 
则 建立 该 词 干 。 需 要 注意 的 是 ，CLIWC 建立 的 词 干 只 包括 首 词 加 “*” 的 格式 ， 
但 查阅 《现代 汉语 词典 第 七 版 》 后 ， 我 们 认为 也 可 以 建立 “*” 加 末 词 格式 的 词 
干 ， 如 “* 莫 ”( 爱 莫 、 渴 莫 、 倾 莫 )。 在 词 干 确立 过 程 中 ， 我 们 再 次 对 词 条 的 词 
类 适合 度 进行 了 确认 。 

最 后 ， 我 们 将 按 上 述 步骤 得 到 的 新 增 词类 、 词 、 词 干 进行 了 整理 。 首 先 ， 我 
们 将 上 述 通过 词类 适合 度 检验 的 新 增 词类 ( 词 ) 和 通过 词性 验证 的 功能 词 (function) 
直接 合并 去 重 加 入 SCLIWC2024 词典 。 然 后 我 们 对 Linguistic、function 词类 进 
行 了 最 终 的 词类 结构 检查 , 将 所 有 下 级 词类 的 词 加 入 上 级 词类 , 同时 整理 出 上 级 
词类 特有 的 词 再 进行 词性 确认 。 最 终 ， 经 过 第 二 阶段 修订 后 的 SCLIWC2024 i] 
典 包含 116 个 词类 ， 共 计 18105 个 词 。 

(=) 大 语言 模型 扩充 词典 

第 三 阶段 的 修订 站 在 根据 腾讯 AI Lab 大 模型 对 SCLIWC2024 词典 进行 扩充 。 

腾讯 AI Lab 此 次 公开 的 中 文 词 向 量 数据 包含 800 多 万 中 文 词汇 ， 其 中 每 个 
词 对 应 一 个 200 维 的 向 量 。 相 比 现 有 的 中 文 词 向 量 数据 ， 腾 讯 AI Lab 的 中 文 词 
向 量 着 重 提升 了 覆盖 率 、 新 鲜 度 和 准确 性 三 个 方面 , 相 比 已 有 各 类 中 文 词 向 量 大 
大 改善 了 其 质量 和 可 用 性 (Song et al., 2018)。 

由 于 Linguistic 维度 下 部 分 词类 是 根据 词性 建立 的 ， 不 能 根据 近义词 扩展 ， 
因此 ， 我 们 排除 了 部 分 功能 词 ， 仅 拓展 了 94 个 词类 。 首 先 ， 我 们 对 每 个 词类 的 


所 有 词 进行 了 近义词 拓展 ,然后 对 所 有 拓展 词 进行 基于 LTP 分 词 (Che et al., 2010) 
的 单一 词 判断 ， 最 后 对 拓展 后 的 近义词 进行 词类 适合 度 判 断 。 最 终 通过 合并 去 重 
加 入 SCLIWC2024 的 新 词 只 有 2883 个 。 
(四 ) 陈旧 词 处 理 和 词类 结构 检查 

第 四 阶段 的 修订 则 在 处 理 SCLIWC2024 词典 中 的 陈旧 词 并 进行 词类 结构 检 


验 。 


对 于 陈旧 词 , SCLIWC2024 词典 中 有 些 词 已 经 很 少 被 人 们 使 用 , 因此 我 们 谨 
慎 地 去 掉 了 某 些 词 。 由 于 这 些 词 大 多 为 名 词 ， 且 多 集中 在 扩展 类 别 (Expanded)， 
因此 我 们 选择 生活 方式 (lifestyle) 下 的 词类 和 网 络 用 词 (netspeak), 根据 三 条 标准 进 
行 陈旧 词 筛选 : 一 是 随时 间 变 化 词义 发 生 改 变 、 不 再 适合 该 词类 的 词 ; 二 是 过 时 、 
不 再 流行 的 词 ; 三 是 使 用 场景 单一 的 词 。 在 去 除 陈旧 词 后 ,我 们 对 SCLIWC2024 
的 词类 结构 进行 了 最 终 检 查 ， 确 保 上 级 词 全 部 包含 下 级 词 ， 并 对 上 级 特有 词 进行 
了 下 级 词类 适合 度 判断 。 

最 终 ， 经 过 上 述 四 个 阶段 修订 的 SCLIWC2024 词典 共 包 含 116 个 词类 ， 其 
中 语言 维度 包含 27 个 词类 ， 心 理 过 程 包含 41 个 词类 ， 扩 展 类 别 (Expanded) 包 括 


48 个 词类 ， 共 计 19952 个 词 。 表 1 列 出 了 各 个 词类 的 名 称 和 范例 。 
表 1 SCLIWC2024 的 语言 维度 和 词类 


Ma 


变量 名 称 Category 简称 范例 词 数 
语言 维度 Linguistic Dimensions Linguistic 2616 
功能 词 Total function words function 这 、 它 、 还 有 2614 
代名词 Total pronouns pronoun 我 、 他 们 、 自 己 145 
特定 人 称 代 名 词 Personal pronouns ppron 我 、 他 、 你 61 
第 一 人 称 单数 代名词 Ist person singular i 和 我、 本人、 自己 17 
第 一 人 称 复数 代名词 1st person plural we 我 们 、 咱 、 咱 们 8 
第 二 人 称 代名词 2nd person you 你 、 您 、 你 的 12 
第 二 人 称 复 数 代名词 * YouPL YouPL 你 们 、 涩 等 、 尔 等 7 
第 三 人 称 单数 代名词 3rd person singular shehe 他 、 她 、 他 的 12 
第 三 人 称 复数 代名词 3rd person plural they 他 们 、 她 们 、 人 家 9 
非特 定 人 称 代 名 词 Impersonal pronouns ipron 其 他 、 那 些 、 彼 此 90 
数字 Numbers number 二 PS 130 
介 系 词 Prepositions prep 在 、 和 、 除 了 117 
助动词 Auxiliary verbs auxverb 要 、 可 以 、 应 该 82 
Sein! Adverbs adverb 都 、 无 论 、 虽 然 700 
连接 词 Conjunctions conj 且 、 并 且 、 虽 然 172 
否定 词 Negations negate 不 、 没 有 、 没 61 


动词 Common verbs verb 分 享 、 说 、 到 818 


变量 名 称 
量词 
比较 词 
疑问 词 
后 置 词 * 
特 指定 词 * 
语 助 词 * 
情态 语 助 词 * 
一 般 语 助词 * 
数量 单位 词 
心理 过 程 
驱 力 词 
联系 词 
成 就 词 
权力 词 
认 知 词 
绝对 主义 思维 
认 知 历程 词 
洞察 词 


* 


冲突 词 
道德 词 


Category 


Quantities 
Comparisons 
Interrogatives 
PrepEnd 
SpecArt 
Particle 
Modal pa 
General pa 
QuanUnit 


Psychological Processes 


Drives 


Affiliation 
Achievement 


Power 


Cognition 


All-or-none 


Cognitive processes 


Insight 
Causation 
Discrepancy 
Tentative 
Certitude 
Inhibition 
Inclusive 
Exclusive 
Differentiation 


Memory 


Affect 


Positive tone 
Negative tone 


Emotion 


Positive emotion 


Negative emotion 


Anxiety 
Anger 
Sadness 


Swear words 


Social processes 


Social behavior 


Prosocial behavior 


Politeness 


Interpersonal conflict 


Moralization 


简称 
quantity 
compare 
interrog 
PrepEnd 
SpecArt 
Particle 
Modal pa 
General pa 
QuanUnit 


Drives 
affiliation 
achieve 
power 
Cognition 
allnone 
cogproc 
insight 
cause 
discrep 
tentat 
certitude 
Inhibition 
Inclusive 
Exclusive 
differ 
memory 
Affect 
tone pos 
tone_neg 
emotion 
emo_pos 
emo_neg 
emo_anx 
emo_anger 
emo_sad 
swear 
Social 
socbehav 
prosocial 
polite 
conflict 


moral 


范例 


稀少 、 


一 些 : 不 等 


先前 、 相 蜡 、 好 比 


的 、 
呢 、 
的 、 
对 、 


什么 、 
期 间 、 以 后 、 为 止 
这 、 什 么 、 那 


还 是 、 怎 么 


了 、 着 
吧 、 吗 
了 、 着 
WSs 里 


主宰 、 让 、 工作 
我 们 、 社会 、 孩子 


LF. jhe. SEB 
Lal. ik. iF 


RA ’ 考虑 所 Bid 


都 、 不 、 没 有 


a 
H 
过 


为 什么 、 因 为 、 


一 | 

Fa 

j 
S ee 
ot gù 


~ RR, MR 


N; 


> 
= 
(= 
* 
at 
说 


ply 


记忆 、 忘 记 、 


se. Te 
喜欢 、 愤怒 、 


欢乐 、 爱 得 
失 


自负 


欢呼 、 BM 
感动 、 高 兴 、 


KIK WER Ef 


取消 、 但 是 、 除 外 


` 


SE 


> 


= 
x om ap a OF 
kal 


也 


不 安 、 担 心 、 焦 虑 


词 数 
233 
188 
32 
52 
27 
113 
101 
12 
154 


2472 
594 
581 
1498 
2500 
48 
2374 
694 
259 
163 
311 
351 
210 
157 
75 
201 
42 
3814 
1524 
1897 
1204 
280 
919 
208 
440 
273 
193 
3671 
2305 
298 
170 
363 
523 


社会 性 参 有 


Dy 


家 庭 词 
朋友 词 
女性 参照 
男性 参照 
人 类 词 
相对 词 
扩展 类 别 
文化 词 
政治 词 
种 族 词 
科技 词 
生活 方式 


O 


感知 历程 词 


y Be Ty 
YES 


Category 
Communication 
Social referents 
Family 
Friends 
Female references 
Male references 
Humans 
Relativity 
Expanded Dictionary 
Culture 
Politics 
Ethnicity 
Technology 
Lifestyle 
Leisure 
Home 
Work 
Money 
Religion 
Physical 
Body 
Health 
Illness 
Wellness 
Mental health 
Substances 
Sexual 
Food 
Death 
States 
Need 
Want 
Acquire 
Lack 
Fulfilled 
Fatigue 
Motives 
Reward 
Risk 
Curiosity 
Allure 
Perception 


Attention 


简称 
comm 
socrefs 
family 
friend 
female 
male 
humans 


Relative 


Culture 
politic 
ethnicity 
tech 
lifestyle 
leisure 
home 
work 
money 
relig 
physical 
body 
health 
illness 
wellness 
mental 
substances 
sexual 
food 
death 


need 
want 
acquire 
lack 
fulfill 


fatigue 


reward 
risk 
curiosity 
allure 
Perception 


attention 


范例 
说 服 、 报 告 、 答 辩 
我 、 伙 伴 、 人 


$ 
> 
H 
m 
站 
Rt 


> Œ 
al = 
eK 
en 
ze od 
S H 


工作 、 企 业 、 合 作 
经 济 、 钱 、 价 1 
灵魂 、 主 、 神 
身体 、 活 力 、 头 
心 、 血 液 、 大 脑 
健康 、 医 疗 、 药 品 
院 、 患 者 、 疾 病 
生活 、 幸 福 、 运 动 
心理 、 发 作 、 诊 断 
酒 、 抽 烟 、 吸 毒 


ba 


词 数 
570 
1419 
292 
154 
263 
210 
329 
2450 


1013 
411 
379 
227 
3778 
1281 
252 
1558 
575 
416 
2874 
573 
943 
502 
151 
113 
140 
257 
795 
288 


77 
37 
185 
82 
50 
68 


142 
224 
74 
307 
3924 
141 


Bi Xí 


= 
ek ek ek 
Bij 


| 2 
ay, 


会 话 词 
网 络 用 词 
应 和 词 
Ze 
MXZ 


Pez 


Category 简称 
Motion motion 
Space space 
Visual visual 
Auditory auditory 
Feeling feeling 

TenseM TenseM 
ProgM ProgM 
Time time 
Past focus focuspast 
Present focus focuspresent 
Future focus focusfuture 

Conversational Conversation 
Netspeak netspeak 
Assent assent 
Nonfluencies nonflu 
Fillers filler 


主 : * 标 识 的 词类 代表 中 文 词典 特有 的 类 别 ， 共 9 个 。 


研究 2 SCLIWC2024 的 效 度 检验 


LIWC 的 有 效 性 一 直 都 是 


类 都 是 有 效 的 ， 


相关 性 ， 成 功 订 


Ay Wa, 600 
说 、 告 诉 、 响 501 
mk A 416 
时 候 、 持 续 、 之 前 1018 
已 经 至 今 13 


未 来 、 然 后 、 明 天 122 
粉丝 、 微 博 、 好 的 913 


靠 、 梗 、 热 搜 780 
好 、 可 以 、 好 的 95 
这 、 啊 、 喂 24 


就 是 、 对 于 、 所 以 42 


个 至 关 重 要 的 问题 。 从 定义 上 讲 ， 词 典 的 每 个 词 


但 我 们 仍 需 回答 一 个 问题 : 当 使 用 某 类 别 的 词汇 时 ， 是 否 意味 着 
人 们 确实 按照 该 类 别 定义 的 方式 表达 了 含义 ? 这 个 问题 涉及 个 体 心 理 过 程 如 何 
反映 在 语言 使 用 中 ， 以 及 词类 作为 特征 集 的 有 效 性 。Pennebaker 和 Francis(1996) 
对 LIWC 的 效 度 进 行 了 最 早 的 测试 ， 通 过 计算 人 类 和 LIWC 对 写作 内 容 评分 的 
FE 明了 LIWC 在 测量 积极 和 消极 情结、 认 知 策略 等 方面 是 有 效 的 。 


人 类 评分 和 LIWC 评分 的 一 致 性 为 LIWC 的 效 度 提供 了 支持 。 
自 LIWC 问世 以 来 ,尽管 数 千 项 研究 和 数 百 个 独立 实验 已 经 证 实 了 其 各 个 类 
别 的 有 效 性 (Boyd & Schwartz, 2021), 184 LIWC 被 翻译 成 其 他 语言 时 ， 我 们 仍 


需要 提供 该 语言 下 的 有 效 性 数据 。 此 外 , 任何 文本 分 析 系 统 的 评估 都 需要 抽取 大 


mi 


量 不 同 主题 的 文本 样本 ， 以 广泛 验 说 


FE 其 有 效 性 。 在 LIWC-22 开发 过 程 中 ，Boyd 


等 人 (2022) 建 并 了 Test Kitchen 语料库 ， 它 包含 了 15 个 从 正式 到 非 正 式 的 主题 ， 
几乎 涵盖 了 所 有 的 网 络 文本 形式 , 广泛 地 代表 了 人 们 在 日 常生 活 中 使 用 单词 的 方 
式 ， 并 且 已 被 用 于 验证 LIWC-22 的 效 度 。 


因此 ， 为 了 满足 处 到 


简体 中 文 文本 ， 特 别 是 网 络 文本 的 需要 ， 我 们 复制 了 


Zhao 等 人 (2016) 对 SCLIWC 的 效 度 检 验 ， 旨 在 回答 两 个 问题 : SCLIWC2024 检 
测 不 同 网 络 文本 心理 表达 的 有 效 性 如 何 ? 以 及 如 何 更 有 效 地 使 用 SCLIWC2024 
来 检测 社交 网 络 平台 短文 本 的 心理 表达 。 
实验 1 

本 实验 由 在 评估 SCLIWC2024 对 网 络 文本 心理 表达 识别 的 有 效 性 。 我 们 通 
过 SCLIWC2024 和 人 工 评分 者 分 别处 理 三 种 不 同 的 网 络 文本 (短文 本 、 长 文本 、 
传统 网 络 文本 )， 以 评估 SCLIWC2024 在 不 同文 本 状态 下 检测 心理 表达 的 效 度 。 
同时 ， 我 们 在 不 同时 间 跨 度 的 微 博 状 态 下 对 SCLIWC2024 不 同 评分 方法 的 效 度 
进行 了 评估 和 比较 。 

方法 

参与 者 和 实验 材料 。 我 们 选取 了 在 中 国 非常 受 欢迎 的 社交 媒体 平台 一 一 新 浪 
微 博 以 及 主流 新 闻 网 站 一 一 人 民 日 报 和 南方 周末 。 

(1) 短文 本 

我 们 随机 抽取 了 120 名 微 博 用 户 (男性 60 名 ， 女 性 60 名 ) 在 2021 年 12 月 1 
日 至 2021 年 12 月 31 日 的 微 博 状 态 ， 这 些 用 户 是 从 我 们 活跃 的 微 博 用 户 池 中 随 
机 抽取 的 (Li et al., 2014)， 并 且 符 合 以 下 要 求 : 

A. 在 2021 年 12 月 1 日 至 2021 年 12 月 31 日 期 间 , 每 个 用 户 发 布 了 90-110 

B. 在 2021 年 12 月 1 日 至 2021 年 12 月 7 日 (第 一 周 ) 期 间 , 每 个 用 户 发 布 了 
20-26 条 有 效 状态 。 

C. Æ 2021 年 12 月 1 日 ， 每 个 用 户 发 布 了 3-4 条 有 效 状 态 。 

此 处 的 有 效 状态 是 指 在 删除 链接 、 转 发 内 容 (“//@ 用 户 名 : ”或 通过 新 浪 微 
博 API 在 下 载 数 据 对 象 的 “retweeted_status” 字 段 中 进行 标记 ) 、 提 及 (“@ 用 户 
名 ”) 和 表情 图 标 后 字数 大 于 0 的 状态 。 我 们 关注 的 是 SCLIWC2024 处 理 文 本 的 
有 效 性 ， 因 此 删除 了 链接 、 表 情 图 标 、 图 片 、 音 频 或 视频 等 超出 SCLIWC2024 
处 理 范 围 的 内 容 。 此 外 ， 提 及 他 人 的 用 户 名 、 转 发 内 容 通常 夹杂 着 广告 、 新 闻 等 
非 个 人 表达 ， 也 了 予以 删除 。 预 处 理 后 样本 的 平均 文本 长 度 为 34.85， 范 围 从 2 到 
234， 男 性 用 户 (98) 的 状态 数 与 女性 用 户 (99) 基 本 相等 ， 但 文本 长 度 男性 (44.60) 略 
高 于 女性 (31.72)。 


(2) 长 文本 

我 们 在 微 博 平台 的 长 文本 板块 中 随机 选取 了 120 名 用 户 (男性 60 名 , 女性 60 
名 ) 的 120 篇 长 文本 (M=1196.0, SD=518.95), 内 容 涉 及 作者 的 经 历 、 思考 和 感受 。 

(3) 传统 网 络 文本 

我 们 选取 了 2022-2024 年 中 国 主 流 媒 体 网 站 (人 民 日 报 、 南 方 周末 ) 发 布 的 120 
条 新 闻 评 论 (M=1446.37, SD=770.36)， 内 容 涉 及 时 政 、 经 济 、 军 事 、 文 化 、 社 会 
热点 等 。 

评定 词类 的 选取 。 我 们 评估 的 重点 是 那些 基于 明确 界定 的 心理 过 程 构建 的 词 
类 ， 而 不 是 那些 仅仅 是 一 类 词 集合 的 词类 (例如 人 称 代词 )。 我 们 选取 了 25 个 
SCLIWC2024 词类 进行 评 佑 ， 包 括 认 知 历程 (allnone、insight、cause、tentat)、 情 


感 历程 (emo_ anger, emo anx, emo sad, emotion, tone neg, tone pos)、 社 会 历 


Fe(conflict. moral, polite, prosocial), EE (health), Æ 77 R(work) IKJ 


ii] (achieve, affiliation, power), 3J#l(allure, curiosity. risk) FUK AS (acquire. fatigue. 
fulfiiD)。 以 往 研 究 中 ， 认 知 历程 、 情 感 历程 、 社 会 历程 和 生理 历程 已 经 被 用 于 预 
测 个 体 的 人 格 特质 、 思 考 过 程 、 身 心 健康 、 人 际 关系 及 其 它 心理 与 行为 指标 ， 并 
展现 了 显著 的 预测 效果 (Tausczik & Pennebaker 2010)。LIWC-22 的 问世 后 ， 部 分 
研究 者 也 开始 用 LIWC-22 中 的 新 增 词类 来 研究 其 他 心理 过 程 ， 例 如 绝对 主义 思 
维 (Yahya & Abdul Rahim, 2023)、 亲 社会 行为 ,冲突 和 道德 等 社会 行为 (Haupt et al., 
2023; Samson et al., 2023)、 动 机 和 状态 类 别 (Cherrstrom et al., 2023)。 因 此 ， 我 们 
增加 了 一 些 近年 来 研究 者 重点 关注 的 LIWC-22 新 增 类 别 。 

人 工 评分 。 评 分 者 需要 根据 每 个 词类 的 定义 判断 给 定 文本 表现 词类 含义 的 程 
度 。 这 些 类 别 的 定义 参考 了 LIWC-22 的 构建 手册 (Boyd et al., 2022)。 我 们 的 评分 
者 被 要 求 评 估 整 个 文本 内 容 的 含义 ， 而 不 是 检测 某 些 单词 。 例 如 ， 如 果 文 本 内 容 
明显 的 表达 了 作者 非 黑 即 白 的 思考 方式 , 那么 不 管 文本 中 是 否 出 现 绝对 主义 思维 
词 ， 它 都 会 被 归 为 绝对 主义 思维 (allnone)， 我 们 也 排除 了 那些 仅仅 为 了 表达 某 种 
偏好 而 使 用 情感 词汇 的 描述 ， 例 如 “很 喜欢 这 部 电视 剧 ”， 以 识别 那些 真正 的 情 
感 表 达 。 

我 们 训练 了 三 名 研究 生 ， 在 不 知道 SCLIWC2024 评分 结果 情况 下 对 所 有 文 
本 进行 独立 评分 。 对 每 个 微 博 用 户 ， 评 分 者 依次 判断 其 第 一 天 /第 一 周 /整个 月 的 


微 博 状 态 表达 每 个 类 别 含义 的 程度 (7 分 制 )。 对 每 个 长 文本 和 新 闻 评 论 ， 评 分 者 
对 整个 文章 也 做 出 类 似 的 判断 ,我 们 以 3 位 评分 者 的 评分 均值 作为 最 终 人 类 评分 
分 数 ， 并 使 用 Cronbach alpha 对 3 个 评分 者 的 信 度 进行 了 测量 ， 结 果 范 围 在 
0.72( 微 博 一 周 _prosocial) 和 0.99( 传 统 网 络 文本 tone pos) 之 间 ， 表 明 评 分 者 在 
三 种 文本 类 型 中 的 评分 一 致 性 都 是 可 接受 的 。 

SCLIWC2024 评分 。 在 对 文本 进行 LTP 分词 后 ， 我 们 使 用 SCLIWC2024 对 
文本 进行 了 两 种 分 析 。 一 是 进行 词 数 计 分 ， 即 直接 使 用 SCLIWC2024 对 微 博 短 
文本 集 (一 个 月 )、 长 文本 集 和 传统 网 络 文 本 集 进行 分 析 ， 得 到 每 个 类 别 的 单词 百 
分 比分 数 。 二 是 进行 状态 数 计 分 ， 对 于 单个 微 博 状 态 ， 若 其 中 出 现 一 个 或 多 个 
SCLIWC2024 类 别 的 单词 , 则 将 其 标记 为 该 类 别 , 然后 计算 每 个 微 博 用 户 在 每 个 
词类 下 的 状态 数 。 

结果 与 讨论 

作为 使 用 LIWC 工具 分 析 文 本 的 常用 方法 , 我们 首先 对 每 个 文本 集 计算 了 每 
个 词类 的 单词 百分比 ,并 与 人 工 评分 进行 比较 。 表 2 展示 了 三 种 文本 下 的 的 单词 
百分比 。25 个 词类 根据 SCLIWC2024 词典 结构 被 分 为 8 个 维度 ， 大 多 数 词类 的 
单词 百分比 与 Boyd 等 人 (2022) 对 不 同文 本 的 分 析 结 果 相 似 。 但 在 认 知 历程 维度 ， 
绝对 主义 思维 (allnone)、 因 果 词 (cause)、 洞 察 词 (insighb 略 高 于 Boyd 等 人 (2022) 
的 结果 ， 尤 其 是 在 长 文本 中 。 在 情感 历程 维度 ， 正 向 感情 (tone_ pos) 和 负 向 感情 
(tone neg) 在 三 种 不 同文 本 中 的 单词 百分比 都 略 高 于 Boyd 等 人 (2022) 的 结果 。 生 
活 方 式 维度 的 工作 词 (work) 和 了 驱 力 词 维度 的 三 个 词类 的 单词 百分比 都 高 于 
pennebaker 等 人 的 结果 , 尤其 是 在 传统 网 络 文本 中 ,而 动机 维度 中 的 吸引 词 (allure) 
的 单词 百分比 要 低 于 pennebaker 等 人 的 结果 。 

三 种 不 同 的 文本 类 型 的 单词 百分比 也 呈现 出 文本 类 型 特征 的 差异 。 传 统 网 络 
文本 以 客观 理性 的 方式 表达 观点 ， 使 用 较 多 的 因果 词 (insight)。 在 内 容 上 ， 微 博 
短文 本 和 长 文本 更 具 个 性 化 表达 , 并且 常用 绝对 化 的 语言 来 夸大 自我 感受 , 例如 

“每 天 都 是 丢人 玩意 ”， 所 以 使 用 较 多 的 绝对 主义 思维 词 (allnone)。 而 传统 网 络 
文本 更 关注 经 济 、 政治 等 公共 话题 , 因此 传统 网 络 文本 使 用 更 多 的 工作 词 (work)、 
成 就 词 (achieve)、 权 力 词 (power)。 


表 2 SCLIWC2024 词典 在 微 博 短文 本 、 长 文本 和 传统 网 络 文本 中 检测 到 的 单词 百分比 


认 知 历程 
allnone 
cause 
insight 
tentat 
情感 历程 
emo_anger 
emo_anx 
emo_sad 
emotion 
tone_neg 
tone_pos 
社会 历程 
conflict 
moral 
polite 
prosocial 
生理 历程 
health 
work 
驱 力 词 
achieve 
affiliation 
power 
动机 
allure 
curiosity 
risk 
acquire 
fatigue 
fulfill 


为 了 检验 SCLIWC2024 在 检测 微 博 短文 本 、 长 文本 和 传统 网 络 文本 心理 


VE: 微 博 短 文本 的 结果 是 根据 胡 
加 粗 的 数据 表明 SCLIWC2024 单词 百分比 要 高 于 / 低 卫 


微 博 (月 ) 长 文本 

3.08(1.43) 4.39(1.32) 
1.39(0.74) 2.29(1.07) 
2.73(1.27) 4.78(1.85) 
1.93(1.02) 3.31(1.45) 
0.46(0.38) 0.70(0.82) 
0.29(0.24) 0.49(0.56) 
0.44(0.41) 0.60(0.60) 
3.91(2.58) 2.99(1.62) 
3.04(1.65) 4.42(2.05) 
8.42(3.79) 6.08(2.43) 
0.29(0.31) 0.50(0.51) 
1.82(1.13) 1.57(1.10) 
1.72(1.13) 0.98(0.69) 
1.29(0.98) 1.05(0.89) 
1.13(0.92) 1.39(1.38) 
4.46(3.61) 4.50(2.91) 
2.62(1.34) 3.27(1.85) 
3.25(2.35) 3.42(2.27) 
3.81(1.32) 5.13(2.08) 
4.32(1.52) 4.59(1.39) 
0.19(0.18) 0.28(0.29) 
0.68(0.45) 1.28(0.81) 
1.80(0.80) 2.60(0.94) 
0.11(0.16) 0.15(0.26) 
0.33(0.24) 0.47(0.36) 

究 中 收集 到 的 每 个 微 博 


传统 网 络 文本 


1.53(0.92) 
3.10(1.33) 
4.40(1.85) 
1.15(0.83) 


0.29(0.54) 
0.21(0.33) 
0.12(0.18) 
1.78(1.00) 
2.24(2.02) 
8.88(3.46) 


0.37(0.75) 
1.38(1.30) 
0.78(0.72) 
1.62(1.37) 


1.94(3.03) 


12.96(5.65) 


6.02(2.96) 
3.23(2.35) 
7.75(3.21) 


3.54(1.38) 
0.40(0.37) 
1.10(1.29) 


1.72(0.89) 
0.02(0.06) 
0.82(0.53) 


j 户 的 所 有 有 效 微 博 状 态 来 计算 的 。 
F LIWC-22. 


表 


达 的 有 效 性 ， 我 们 对 SCLIWC2024 得 分 和 人 工 评分 进行 了 Pearson 相关 分 析 ( 表 
3)。 当 使 用 词 数 计 分 作为 SCLIWC2024 评分 方法 时 ， 除 了 动机 和 状态 类 别 外 ， 

大 部 分 词类 在 长 文本 和 传统 网 络 文本 的 相关 性 高 于 微 博 短文 本 (月 )， 且 有 更 多 的 
显著 相关 性 。 对 于 认 知 历程 类 别 ， 长 文本 和 传统 网 络 文 本 中 大 部 分 词类 的 


SCLIWC2024 得 分 与 人 类 评分 之 间 的 相关 性 显著 且 达到 中 等 水 平 , 对 于 情感 历程 ， 
SCLIWC2024 得 分 与 人 类 对 三 种 文本 类 型 的 评分 之 间 的 相关 性 非常 密切 .对 于 社 
会 历程 ， 除 了 “道德 词 (moral)” 外 ， 其 他 三 个 词类 在 传统 网 络 文 本 上 显著 相关 ， 
且 高 于 在 微 博 短 文本 和 长 文本 中 的 相关 性 。 对 于 生理 历程 类 别 ,传统 网 络 文本 达 
到 了 较 高 的 显著 相关 ， 而 在 生活 方式 类 别 , 长 文本 有 着 中 等 显著 相关 性 。 对 于 驱 
力 词 ， 除 “成 就 词 (achieve)” 在 长 文本 不 显著 外 ， 其 它 词 类 在 长 文本 和 传统 网 络 
文本 中 均 有 中 等 显著 相关 性 。 对 于 动机 和 状态 类 别 ， 相 关 性 普遍 较 低 ， 且 较 少 词 
类 显著 相关 ， 只 有 “风险 词 Gisl)” 在 传统 网 络 文本 上 有 高 显著 相关 、“ 疲 倦 词 
(fatigue)” 在 长 文本 有 中 等 显著 相关 。 

目前 的 研究 结果 表明 , SCLIWC2024 词 数 计 分 在 检测 微 博 短 文本 、 长 文本 和 
传统 网 络 文本 心理 表达 方面 是 有 效 的 。 所 选 类 别 的 单词 百分比 以 及 在 不 同文 本 之 
间 的 差异 与 Boyd 等 人 (2022) 和 Zhao 等 人 (2016) 的 结果 相似 , 证实 了 SCLIWC2024 
的 结构 效 度 。 此 外 ， 从 表 3 可 以 看 出 ， 不 同心 理 语义 类 别 的 有 效 性 不 同 ， 这 也 与 
Zhao 等 人 (2016) 的 研究 一 致 , 反映 出 不 同心 理 语义 类 别 在 语言 中 不 同 的 映射 方式 。 
表 3 SCLIWC2024 词 数 计 分 与 人 工 评 分 在 三 种 文本 之 间 的 相关 性 


微 博 (月 ) 长 文本 传统 网 络 文本 
认 知 历程 
allnone 0.125 0.323** 0.151 
cause 0.159 0.431** 0.272** 
insight 0.127 0.511** 0.234* 
tentat 0.154 0.189* 0.407** 
情感 历程 
emo_anger 0.236** 0.289** 0.705** 
emo_anx 0.144 0.398** 0.546** 
emo_sad 0.231* 0.644** 0.582** 
emotion 0.223* 0.511** 0.383** 
tone_neg 0.110 0.600** 0.586** 
tone_pos 0.213* 0.395** 0.142 
社会 历程 
conflict 0.019 0.548** 0.593** 
moral 0.103 0.394** 0.101 
polite 0.113 0.115 0.372** 
prosocial 0.086 0.09 0.342** 
health 0.094 0.584** 0.838** 
生活 方式 


work 0.205* 0.560** 0.282** 


长 文本 


0.11 
0.462** 
0.476** 


0.126 
0.142 
0.296** 


0.162 
0.359** 
0.128 


微 博 (月 ) 

驱 力 词 

achieve 0.017 

affiliation 0.094 

power 0.108 

动机 

allure 0.127 

curiosity 0.178 

risk 0.178 

状态 

acquire 0.056 

fatigue 0.099 

fulfill 0.018 
YE: 加 粗 的 数据 表明 SCLIWC2024 分 数 与 人 类 评分 显著 相关 。 
* <0.05 

** <0.01 


日 


传统 网 络 文本 


0.271** 
0.304** 
0.370** 


0.127 
0.234* 
0.720** 


0.117 
0.05 
0.15 


虽然 我 们 证 明了 SCLIWC2024 在 相当 数量 的 微 博 状态 (一 个 月 ) 中 检测 心理 


表达 的 有 效 性 ， 但 当 文 本 长 度 缩短 时 ，SCLIWC2024 是 否 仍然 有 效 ? 为 了 检验 
SCLIWC2024 对 短文 本 心理 表达 识别 的 有 效 性 ， 我 们 对 一 天 、 一 周 、 
博 状态 下 的 SCLIWC2024 得 分 ( 词 数 计 分 和 状态 数 计 分 ) 和 人 工 评 分 进行 了 


个 月 的 微 


Pearson 相关 分 析 ( 表 必 。 结 果 发 现 从 一 天 到 一 周 ， 一 周到 一 个 月 ， 显 著 相 关 的 词 
类 数 依次 减少 ， 但 都 有 小 到 中 等 的 相关 。 我 们 的 结果 与 Zhao 等 人 (2016) 的 结果 


完全 相反 , 这 可 能 与 人 工 评 分 者 主观 感受 的 形成 机 
序 、 主 题 不 定 的 微 博 状态 ， 评 分 者 判断 一 天 的 心理 


出 有 关 ， 相 比 于 一 整 月 杂乱 无 


语义 表达 是 更 容易 的 。 而 对 于 


几乎 所 有 SCLIWC2024 得 分 与 人 类 评分 之 间 存 在 显著 相关 性 的 类 别 ， 使 用 
SCLIWC2024 状态 数 计 分 的 方法 时 ， 相 关 性 变 得 更 高 ， 这 与 Zhao 等 人 (2016) 的 


典 检测 心理 语义 表达 。 


结果 一 致 ， 表 明 相 比 词 数 计 分 ， 使 用 状态 数 计 分 能 更 好 地 利用 SCLIWC2024 if] 


表 4 不 同时 间 跨 度 微 博 状态 下 人 类 评分 与 SCLIWC2024 分 数 ( 词 数 /状态 数 ) 之 间 的 相关 性 
传统 网 络 文本 


微 博 (月 ) 
认 知 历程 
allnone 0. 023/0. 364** 
cause 0. 059/0. 437** 
Aht 0. 105/0. 318** 
tentat 0. 098/0. 036 
情感 历程 


emo anger 0. 249**/0. 291** 


长 文本 


0. 253**/0. 314** 
0. 131/0. 545** 
0. 044/0. 592** 
0. 368**/0. 141 


0. 052/0. 123 


0. 125/0. 028 
0. 159/0. 121 
0. 127/0. 145 
0. 154/0. 108 


0. 236%**/0. 116 


emo_anx 
emo_sad 
emotion 
tone_neg 
tone pos 
社会 历程 
conflict 
moral 
polite 
prosocial 
生理 历程 
health 
生活 方式 
work 

驱 力 词 
achieve 
affiliation 
power 
动机 
allure 
curiosity 
risk 

状态 
acquire 
fatigue 
fulfill 


系数 增 大 。 
* <0. 05 
ek <0. 01 


实验 2 


微 博 ( 月 ) 


0. 
. 041/0. 272% 


0 
0. 
0 
0 


ooo Oo 


168/0. 326** 


199*/0, 253** 


. 208*/0. 212* 
. 232*/0. 269% 


. 188*/0. 461** 
. 181*/0. 229* 
. 051/0. 302** 
. 109/0. 360** 


. 195*/0. 455** 


. 139/0. 431** 


. 116/0. 254** 
. 222*/0. 3822 
. 116/0. 182* 


. 103/0. 312** 
. 012/0. 026 
. 124/0. 349** 


. 09/0. 039 
0. 
0. 


YE: 加 粗 的 成 对 数据 表明 ， 当 使 / 


351**/0. 284* 
092/0. 031 


长 文本 


0 
0 
0. 
0 
0 


SS SO © 


0. 


0. 
0 
0. 


米 


. 093/0. 
. 085/0. 
. 114/0. 
. 105/0. 
. 154/0. 


. 115/0. 
. 036/0. 


. 098/0. 148 
. 325**/0. 554** 


155/0. 214* 


. 01/0. 193* 
. 200*/0. 182* 


057/0. 492** 
007 
346** 


213* 
223* 
348" 
252 


324 


149/0. 255% 


072/0. 351** 
112/0. 014 


. 293**/0. 43 1** 


077/0. 259% 


. 200*/0. 326** 


126/0. 035 


状态 数 计 分 作为 SCLIWC2024 记 


传统 网 络 文本 


0. 
. 231*/0. 046 
. 223*/0. 02 
. 11/0. 012 

. 213*/0. 073 


0 
0 
0 
0 


ooo oO 


0 


分 方法 时 ， 相 关 性 显 


. 017/0. 
. 094/0. 
. 108/0. 


. 127/0. 


. 099/0. 
0. 


144/0. 274** 


. 019/0. 204% 
. 103/0. 012 

. 113/0. 154 

. 086/0. 298** 


. 094/0. 063 


. 205*/0. 162 


048 
164 
006 


265** 
022 
188* 


178/0. 
178/0. 
056/0. 029 
12 


018/0. 048 


在 新 浪 微 博 等 社交 网 络 平台 上 ， 状 态 (帖子 ) 是 表达 完整 思想 的 自然 单位 ， 也 


是 解读 社交 媒体 用 户 心 理 
SCLIWC2024 状态 数 计 分 在 检测 微 博 状态 的 心理 
否 可 以 用 来 判断 单个 微 博 状态 的 心理 


Le ML? 


表达 的 单位 (Zhao et al，2016) 。 在 实验 1 中 ， 
表达 方面 突出 , 那么 这 种 方法 是 


知 能 根据 茶 单 一 状态 的 心理 含义 , 自 


动 准确 地 将 其 归 类 为 SCLIWC2024 类 别 ， 则 可 进一步 扩大 SCLIWC2024 的 适用 


y 


围 。 为 了 回答 这 个 问题 ， 


个 微 博 状态 心理 


意义 方面 的 有 效 性 。 


我 们 进行 了 实验 2， 旨 在 评 信 


E SCLIWC2024 在 识别 单 


参考 Bantum 和 Owen(2009) 以 及 Zhao 等 人 (2016) 的 方法 ， 我 们 使 用 信号 检 
测 论 (Green & Swets, 1966) 和 信号 检测 指标 来 量化 SCLIWC2024 识别 心理 表达 的 
有 效 性 。 为 了 估计 单个 微 博 状 态 中 某 SCLIWC2024 类 别 的 词 是 否 表达 了 该 类 别 
的 意义 ， 我 们 把 表达 某 一 类 别 心理 意义 称 为 信号 ， 而 缺乏 这 种 表达 的 则 为 噪声 。 
实验 采用 了 四 个 信号 检测 论 指标 : 

(a) 灵敏 度 。 被 评分 者 识别 为 指示 每 个 类 别 的 微 博 状态 中 被 SCLIWC2024 标 
记 为 同一 类 别 的 比例 ; 

(b) 特异 性 。 被 评分 者 识别 为 不 指示 每 个 类 别 的 微 博 状 态 也 被 SCLIWC2024 
标记 为 与 同一 类 别 无 关 的 比例 ; 

(c) 阳性 预测 值 。SCLIWC2024 标记 为 指示 每 个 类 别 的 微 博 状态 与 评分 者 对 
同一 类 别 编码 一 致 的 概率 ; 

(d) 阴性 预测 值 。SCLIWC2024 标记 为 不 指示 每 个 类 别 的 微 博 状态 与 评分 者 
判断 该 状态 与 同一 类 别 无 关 的 相符 概率 。 

方法 

参与 者 和 材料 。 对 实验 1 中 的 120 名 微 博 用 户 , 我 们 对 每 个 用 户 随机 抽取 了 
5 条 微 博 状态 ， 共 计 600 条 微 博 状态 (M=36.08, SD=39.61)， 作 为 实验 2 的 样本 。 

人 工 评分 。 实验 1 中 的 3 名 评分 者 继续 在 实验 2 中 进行 评分 , 评分 者 被 要 求 
根据 词类 定义 独立 判断 给 定 文本 是 否 表达 了 某 词 类 含义 。 评 分 规则 与 实验 1 相同 ， 
目的 是 识别 微 博 状 态 的 真实 含义 而 不 是 检测 任何 特定 的 单词 。 在 每 个 类 别 上 ， 
个 微 博 状 态 由 3 个 评分 者 来 评定 ， 若 出 现 不 一 致 , 则 依据 少数 服从 多 数 原 则 确定 
最 终 评定 结果 。 我 们 对 每 对 评分 者 在 每 个 词类 的 评定 进行 了 评分 者 一 致 性 计算 ， 
kappa 得 分 在 0.57 至 0.93， 表 明 不 同 评分 者 之 间 的 一 致 性 良好 。 

SCLIWC2024 评分 。SCLIWC2024 的 评分 与 实验 1 中 的 状态 数 计 分 相同 。 

结果 与 讨论 

为 了 评估 SCLIWC2024 识别 单个 微 博 状态 心理 表达 的 有 效 性 ， 我 们 使 用 人 
工 评分 和 SCLIWC2024 评分 的 数据 计算 了 四 个 信号 检测 论 指标 : 灵敏 度 、 特 异 
性 、 阳 性 预测 值 、 阴 性 预测 值 ( 表 5). 
结果 显示 , SCLIWC2024 对 心理 表达 识别 的 效 度 在 不 同 指标 和 不 同类 别 上 表 
现 出 很 大 差异 。 除 洞察 词 (insight)、 生 气 词 (emo_anger)、 冲 突 词 (conflict)、 吸 引 


ii] (allure), 4 AÙ (curiosity). 4&4 iF] (acquire). JE M W (fatigue) 4b, AZ RW 
SCLIWC2024 词类 的 灵敏 度 均 高 于 0.7, 绝对 主义 思维 词 (allnone)、 因 果 词 (cause) 
的 灵敏 度 达到 了 0.95。 除 权力 词 (power) 和 吸引 词 (allure) 外 , 大 多 数 SCLIWC2024 
词类 的 特异 性 均 高 于 0.7, 后 气 词 (emo anger)、 焦 虚词 (emo anx)、 翡 伤 词 (emo _sad)、 
冲突 词 (conflict)、 好 奇 心 (curiosity)、 疲 倦 词 (fatigue) 的 特异 性 达到 了 0.95。 阳 性 
预测 值 词类 之 间 存 在 比较 大 的 差异 (0.11-0.81)， 并 且 大 部 分 词类 的 值 都 在 0.7 以 
F, 只 有 情绪 词 (emotion)(0.77) 和 正 向 感情 (tone_pos)(0.81) 的 该 指标 值 较 高 ， 即 被 
SCLIWC2024 识别 为 直接 表达 情绪 和 表达 正 向 感情 的 文本 中 , 分 别 有 77% 和 81% 
的 文本 也 被 人 工 评分 者 认为 直接 表达 了 情绪 或 表达 了 正 向 感情 。 对 于 阴性 预测 值 ， 
除 正 向 感情 (tone pos)(0.64) 外 ， 大 部 分 词类 的 该 指标 值 都 非常 高 (0.81-1.00)， 即 

有 36% 的 文本 虽然 没有 出 现 正 向 感情 的 词 ， 但 语气 或 内 容 其 实 表 达 了 正 向 情感 。 

表 5 SCLIWC2024 在 单个 微 博 状 态 评分 中 的 平均 敏感 性 、 特 异性 、 阳 性 预测 值 和 阴性 预测 值 


灵敏 度 特异 性 阳性 预测 值 阴性 预测 值 

认 知 历程 

allnone 0. 95 (0. 05) 0. 79 (0. 01) 0. 36 (0. 03) 0. 99 (0. 01) 
cause 0. 97 (0. 06) 0. 87 (0. 00) 0. 33 (0. 03) 1. 00 (0. 00) 
insight 0. 61 (0. 12) 0. 82 (0. 03) 0. 61 (0. 04) 0. 81 (0. 10) 
tentat 0. 78 (0. 04) 0. 83 (0. 01) 0. 34 (0. 06) 0. 97 (0. 01) 
情感 历程 

emo_anger 0. 60 (0. 11) 0. 96 (0. 00) 0. 27 (0. 03) 0. 99 (0. 01) 
emo_anx 0. 72 (0. 25) 0. 98 (0. 00) 0. 17 (0. 00) 1. 00 (0. 00) 
emo sad 0. 82 (0. 13) 0. 97 (0. 00) 0. 44 (0. 05) 0. 99 (0. 00) 
emotion 0. 70 (0. 09) 0. 87 (0. 03) 0. 77 (0. 07) 0. 82 (0. 09) 
tone_neg 0. 82 (0. 07) 0. 84 (0. 01) 0. 51 (0. 04) 0. 96 (0. 02) 
tone_pos 0. 76 (0. 04) 0. 71 (0. 04) 0. 81 (0. 06) 0. 64 (0. 10) 
社会 历程 

conflict 0. 63 (0. 07) 0. 99 (0. 00) 0. 62 (0. 03) 0. 99 (0. 00) 
moral 0. 75 (0. 09) 0. 77 (0. 00) 0. 12 (0. 01) 0. 99 (0. 01) 
polite 0. 78 (0. 02) 0. 85 (0. 03) 0. 39 (0. 14) 0. 97 (0. 01) 
prosocial 0. 75 (0. 07) 0. 89 (0. 01) 0. 50 (0. 05) 0. 96 (0. 02) 
生理 历程 

health 0. 82 (0. 08) 0. 87(0. 00) 0. 21 (0. 01) 0. 99 (0. 00) 
生活 方式 

work 0. 92 (0. 04) 0. 71 (0. 00) 0. 44 (0. 02) 0. 97 (0. 02) 
驱 力 词 

achteve 0. 92 (0. 00) 0. 75 (0. 00) 0. 19 (0. 01) 0. 99 (0. 00) 


affiliation 0. 78 (0. 08) 
power 0. 92 (0. 04) 


= 


73 (0. 01) 
67 (0. 00) 


© 


. 42 (0. 05) 0. 92 (0. 04) 
11 (0. 02) 0. 99 (0. 00) 


> 
2 


动机 
allure 
curiosity 
risk 
acquire 
fatigue 
fulfill 


讨论 


灵敏 度 


0. 64 (0. 03) 
0. 42 (0. 13) 
0. 76 (0. 20) 


0. 64 (0. 10) 
0. 39 (0. 10) 
0. 77 (0. 02) 


特异 性 


0. 62 (0. 02) 
0. 97 (0. 00) 
0. 93 (0. 00) 


0. 83 (0. 01) 
0. 99 (0. 00) 
0. 93 (0. 00) 


几 十 年 来 ， 语 言 心理 
方面 , 以 LIWC 为 代表 的 自然 语言 处 


阳性 预测 值 


0. 26 (0. 08) 
0. 15 (0. 05) 
0. 30 (0. 04) 


0. 37 (0. 06) 
0. 17 (0. 06) 
0. 20 (0. 02) 


心理 学 研究 跨越 了 许多 不 同 的 主题 ， 尤 其 是 随 着 LIWC-22 的 面世 ， 许 多 新 
LE 语义 方面 表现 出 了 很 好 的 侦 测 率 和 有 效 性 (Boyd et al., 2022). 


类 在 检测 文本 心理 


阴性 预测 值 


0. 89 (0. 03) 
0. 99 (0. 00) 
0. 99 (0. 01) 


0. 93 (0. 04) 
1. 00 (0. 00) 
0. 99 (0. 00) 


学 研究 一 直 建立 在 “单词 代表 注意 力 ”的 原则 上 ,在 这 
[ 具 一 直 是 解释 和 语 境 化 语言 心理 学 研究 


结果 的 直观 和 可 靠 的 框架 (Boyd & Schwartz, 2021)。 在 这 套 工 具 的 帮助 下 ， 语 言 


Hi 


因此 ， 为 了 让 中 文化 的 词典 更 适合 LIWC-22 的 框架 ， 本 文通 过 两 项 研究 对 


SCLIWC2024 进行 了 更 新 和 验证 。 
在 研究 一 ， 我 们 通过 添加 新 


典 、 陈旧 词 处 至 
了 包含 27 个 语 


=> 


维度 词类 、41 个 心理 


Min], BES LIWC2022 词典 、 大 语言 模型 扩充 词 


和 词类 结构 检查 四 个 阶段 完成 了 对 SCLIWC2024 的 修订 ， 得 到 
过 程 词类 、48 个 扩展 词类 的 SCLIWC2024 


词典 。 在 研究 二 ， 我 们 通过 两 项 实验 对 SCLIWC2024 词典 进行 了 效 度 检 验 ， 回 


答 了 两 个 问题 。 
SCLIWC2024 检测 不 同 网 络 文 本 心理 
SCLIWC2024 对 微 博 短文 本 、 长 文本 和 传统 网 络 文本 的 若干 重要 的 心理 


表达 的 有 效 性 。 两 项 实验 的 结果 均 表 明 
表达 的 检 


测 是 有 效 的 。 实 验 1 中 ， 我 们 通过 对 SCLIWC2024 得 分 和 人 工 评 分 进行 相关 分 
析 ， 在 大 部 分 词典 类 别 中 发 现 了 显著 相关 性 ， 而 且 在 使 用 SCLIWC2024 状态 数 
计 分 方法 时 ， 相 关系 数 可 能 更 高 ， 这 表明 了 我 们 更 新 和 扩充 的 SCLIWC2024 词 


典 对 检测 网 络 文本 的 心理 


表达 是 有 效 的 。 实 验 2 基于 信号 检测 论 的 评估 显示 ， 


SCLIWC2024 词典 的 大 部 分 词类 都 具有 较 高 的 灵敏 度 、 特 异性 和 阴性 预测 值 ， 四 
项 指标 值 均 高 于 Zhao 等 人 (2016) 之 前 的 结果 。 三 种 网 络 文本 类 型 在 内 容 和 风格 


上 的 差异 也 反映 在 我 们 的 结果 中 ， 包 括 单 


词 百 分 比 以 及 SCLIWC2024 得 分 与 人 


工 评分 之 间 的 相关 性 。 单词 百分比 的 差异 反映 了 不 同 网 络 文本 的 性 质 , 而 相关 系 
数 的 差异 则 表明 了 SCLIWC2024 在 不 同类 型 网 络 文本 中 检测 心理 表达 的 有 效 性 
存在 差异 。 

如 何 更 有 效 地 使 用 SCLIWC2024 来 检测 社交 网 络 平台 短文 本 的 心理 表达 。 
我 们 从 文本 量 和 评分 方法 两 个 方面 对 该 问题 进行 了 探讨 。 我 们 发 现 无 论 是 短 到 一 
天 还 是 长 到 一 个 月 的 微 博 状态 量 , SCLIWC2024 都 可 以 有 效 地 检测 多 个 类 别 的 心 
语义 ， 但 随 着 状态 数量 的 减少 (从 一 个 月 减少 到 一 天 )，SCLIWC2024 可 以 有 效 
地 检测 更 多 类 别 。 这 可 能 与 人 工 评分 者 主观 感受 的 形成 机 制 有 关 ， 相 比 于 一 天 ， 
一 个 月 的 微 博 状 态 更 加 杂乱 无 序 、 主 题 不 定 , 评分 者 不 太 容 易 准 确 把 控 所 有 文本 
整体 表达 心理 语义 的 程度 ， 而 这 恰恰 表明 了 SCLIWC2024 词典 在 处 理 大 量 短文 
本 时 ， 比 人 工 评定 更 有 优势 。 此 外 ， 除 了 使 用 SCLIWC2024 词 数 计 分 (单词 百 分 
比 )， 还 可 以 考虑 状态 数 计 分 。 在 我 们 的 结果 中 ， 相 比 词 数 计 分 ， 状 态 数 计 分 通 
常 与 人 类 评分 有 更 高 更 显著 的 相关 性 ， 这 表明 状态 数 计 分 是 使 用 SCLIWC2024 
检测 社交 网 络 平台 文本 心理 表达 的 非常 有 效 的 方法 。 

SCLIWC2024 对 单个 微 博 状态 心理 表达 识别 的 有 效 性 ,虽然 在 一 组 微 博 短文 
本 中 SCLIWC 状态 数 计 分 与 人 类 评分 之 间 存 在 显著 相关 性 ， 但 在 单个 微 博 状 态 
中 SCLIWC 状态 数 计 分 识别 心理 表达 的 有 效 性 并 不 是 那么 好 。 一 个 主要 问题 是 
阳性 预测 值 较 差 ， 这 与 Zhao 等 人 (2016) 的 结果 一 致 。 例 如 ， 生 气 词 (emo_anger) 
的 阳性 预测 值 为 0.27， 这 表明 被 SCLIWC2024 识别 为 直接 表达 生气 情绪 的 文本 
中 ， 只 有 27% 的 文本 也 被 人 工 评分 者 认为 直接 表达 了 生气 情绪 。 也 就 是 说 ， 
SCLIWC2024 对 单个 微 博 状态 心理 语义 的 判断 包含 较 多 虚报 。 正 如 Boyd 和 
Schwartz(2021) 指 出 的 那样 ， 这 是 基于 “单词 代表 注意 力 ” 原 则 的 工具 的 固有 缺 
陷 , 它们 忽略 了 上 下 文 语 境 。 然而 , 考虑 到 SCLIWC2024 大 部 分 词类 在 灵敏 度 、 
特异 性 和 阴性 预测 值 上 很 好 的 表现 ， 我 们 可 以 得 出 结论 ， 即 通过 SCLIWC2024 
可 以 履 新 大 部 分 表达 所 选 词类 含义 的 微 博 状 态 ， 但 SCLIWC2024 识别 单个 微 博 
状态 的 心理 意义 的 效 度 并 不 理想 。 


上 
总 结 


/入 二 


本 研究 对 SCLIWC2024 词典 进行 了 系统 性 、 全 面 性 地 更 新 ， 并 为 其 作为 分 


析 网 络 文本 心理 语义 的 有 效 性 提供 了 证 据 。 我 们 的 研究 推进 了 LIWC 工具 中 文化 
的 进程 ， 揭 示 了 LIWC 工具 在 处 理 不 同 主题 文本 时 的 普遍 问题 。 

然而 ，LIWC 系列 工具 只 是 简单 基于 “单词 代表 注意 力 ” 的 原则 ， 虽 然 扩展 
了 一 个 描述 各 种 心理 过 程 和 注意 模式 之 间 相 关 性 的 网 络 , 但 它 限制 了 使 用 单词 计 
数 方法 探索 经 验 问题 的 类 型 , 也 没有 被 设计 用 来 适应 语言 行为 的 全 部 复杂 性 和 功 
能 (Boyd & Schwartz, 2021)。 因 此 ， 我 们 仍 需 要 思考 如 何 使 用 和 改进 这 些 工 具 ， 
以 更 好 地 服务 于 网 络 数据 挖掘 和 语言 心理 学 研究 。 
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